数据脱敏的实现方式有哪些?
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在数据脱敏过程中,需要根据数据的使用场景,选择相应的数据脱敏方式:
遮蔽脱敏
遮蔽脱敏方式是对数据的全部或者一部分用符号替换,例如原手机号为:18688888888,经过脱敏后改为:186****8888。应用比较广泛的场景有:金融,医疗,政务等行业的排队叫号系统、呼叫中心系统;互联网的电子商务、外卖订单系统等。
保格式脱敏
保格式脱敏方式是保留数据的主要格式,例如:对于身份证只需保证为18位数字,手机号为11号数字。应用比较广泛的场景有:各行业的系统研发、功能测试等。
保留数据特征脱敏
保留数据特征脱敏方式是保证数据脱敏的情况下依然能保留数据原始特征并能通过业务校验,不影响数据分析。例如:身份证号在进行脱敏之后,依然是正确的身份证号,系统校验方式也能正常通过。地址脱敏后也是真实存在的地址。应用比较广泛的场景有:数据分析场景等。
泛化脱敏
泛化脱敏方式是保留原始数据的局部特征的前提下使用其他方式替代原始数据的方式。例如:只需要知道人群的年龄阶段:11-20、21-30、31-40……不需要知道具体年龄的场景。应用比较广泛的场景有:数据统计场景等。
数据一致性脱敏
数据一致性脱敏方式是原始数据的关联关系在进行数据脱敏后也能保持关联关系。这种关联关系不只是对数据表的主外建的关联,对非主外建的关联关系也能保证关联的一致性。应用比较广泛的场景有:系统二次开发、修改场景等。
可逆性脱敏
可逆性脱敏方式是脱敏后数据可以使用对应表,对数据进行恢复操作,从脱敏数据可以获取原始数据。此类方式会保存脱敏数据对应表,根据业务需求,这些脱敏算法可以结合使用。而且对每一种脱敏方式,也可以使用不同的脱敏规则来进行脱敏。应用比较广泛的场景有:数据分析后需要真实结果的场景等。